JSAI2026 検索エンジンのAI要約機能における参照記事選択基準の分析
テーマ
GoogleのAI Overviewsが、どのような記事を参照元として選びやすいかを分析する研究
生成型の検索体験
従来のSEO的な順位ではなく、検索クエリと記事本文の「意味的な適合度」に注目する
検索のトレンド
SEO(検索エンジン最適化)からGEO(生成エンジン最適化)へ
先行研究: GEOの概念の提唱(Aggarwal+ 2024)
可視性が最大40%向上
AI要約中に引用された文の長さと位置、LLMによる主観的な評価を掛け合わせて計算される独自スコア
先行研究: AIがどのような情報源を好んで引用するか(Chen+ 2025)
ChatGPT、Perplexity、Claude、Gemini
AI検索は知名度の高い大手のブランドを優遇する傾向がある
先行研究: AIようやくエンジンが引用元を選ぶ際に、Webページの性質がいかに影響するか(Kumar+ 2025)
Metadata & Freshness, Semantic HTML, Structured Data
が重視される傾向
背景課題
検索体験は、リンク一覧からAIによる回答生成へ移りつつある
SEOだけでなく、AIに参照されやすくするGEOが重要になっている
既存研究では、HTML構造、メタデータ、情報源の種類などは分析されている
しかし、本文内容そのものがクエリ意図にどれだけ合っているかは十分に検証されていなかった
提案
日本語ModernBERTを使い、クエリとWebページ本文の意味的適合度を予測するランキングモデルを構築
Google のオーガニック検索上位100件を使って、検索順位を再現するようにペアワイズ学習する
入力: Query + HTML
そのモデルで、AI Overviewsの参照記事と通常検索結果の記事を比較する
意味的な類似度を計算
データ収集
Informationalクエリに限定
知識や情報を得るために使用するクエリ
考察
AI Overviewsは、単に通常検索上位をそのまま引用しているわけではなさそう
通常検索よりもさらに、クエリ意図に強く合った本文を選んでいる可能性がある
GEOでは、ドメイン権威性やHTML構造だけでなく、本文が検索意図にどれだけ正確に応答しているかが重要になる
感想 daiiz.icon
LLM時代の検索を考える観察日記と研究モチベーションが似てる
先行研究と定量的な観察のアプローチを知れてよかった
自分の同人誌では定性的な言及しかできてなかった
#聴講メモ